『Amazon Redshiftの分析対象とするデータの設計/加工のポイント』をCodeZineに寄稿しました
『Amazon Redshiftによるビッグデータ分析環境の構築』というテーマでの連載をCodeZineにて始めさせて頂き、先日第1回『Amazon Redshiftで構築するビッグデータ分析環境の構成要素と全体像』を寄稿致しましたが、続編となる第2回分を本日、寄稿させて頂きました!
連載第2回はRedshiftに投入し、分析対象となるデータの元となる『ファイル』やファイルが格納される『テーブル』について焦点を当てています。分析を行う上で、『今ある』データがそのまま分析対象のデータとして活用出来るかどうかはその個々の環境に応じて異なって来ます。そう言った点についての当たりの付け方、取り組み方についての指針的なものについて、私なりの対策や対応方法をまとめさせて頂きました。興味を持たれた方々や、実際今このような作業に取り組まれている方々の一助になれば幸いです。